面向 SKA-1 时 代 的 科学 数据 流 及 阵列 模拟 分 析 
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摘要 ”作为 下 一 代 射 电 望 远 镜 ， 平 方 公里 阵列 望远镜 (SKA) 经 过 多 年 的 筹备 ,第 一 阶段 (SKA1) 已 经 在 
2021 #7 月 开工 建设 ，SKA1 正式 运行 后 预计 每 年 将 产生 750PB 的 科学 归档 数据 ， 这 些 数 据 将 存储 在 世 
界 各 地 的 SKA 区 域 中 心 供 科研 工作 者 使 用 。 本 文 将 SKA 观 测 台 站 、 中 央 信 号 处 理 器 、 科 学 数据 处 理 及 区 
域 中 心 等 各 个 阶段 的 模型 进行 量化 分 析 ， 以 SKAL 的 高 优先 级 科学 观测 为 主要 依据 ,得 出 每 个 阶段 的 数据 
流 评 佑 情况 ， 以 及 对 科学 数据 处 理 算 力 的 需求 。 以 当前 SKA1-low 和 SKAl-mid 的 阵列 为 例 ， 总 结 了 包括 
A EXE, ROE. UV 覆盖 等 影响 干涉 阵列 布局 的 关键 因素 ; 最 后 使 用 OSKAR 进行 干涉 阵列 的 数据 模拟 ， 
通过 对 SKA1-mid 的 模拟 得 出 系统 的 可 扩展 性 和 稳定 性 ， 通 过 对 SKA1-low 在 CSRC-P 上 的 模拟 ， 可 以 看 出 
HE] SKA 区 域 中心 原 型 机 设计 经 过 了 充分 的 论证 和 优化 ， 并 得 出 了 详细 的 算 力 需求 以 及 数据 量 的 详细 信 
息 。SKA 对 数据 处 理 、 计 算 、 存 储 等 的 需求 ， 将 需要 电子 、 通 信 、 信 息 、 计 算 机 等 技术 和 交 又 学 科 的 联合 
推动 。 
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SKA 使 用 综合 孔径 技术 ， 将 阵列 中 的 信号 进 
行 合成 处 理 ， 提 供 一 个 等 效 口径 为 1 公里 的 射电 
yeti. SKA 将 产生 海量 的 数据 ， 以 SKA1-mid 为 
例 ， 位 于 阵列 附近 的 中 央 信 号 处 理 器 (Centre Sig- 
nal Process， 简 称 CSP) 对 18Tb/s 的 数字 化 数据 
流 进 行 波束 和 相关 处 理 铝 ， 然 后 将 其 传输 到 开 普 敦 
的 专用 超级 计算 机 进行 进一步 处 理 。 这 些 数据 流 的 
处 理 过 程 对 SKA 整个 系统 的 设计 至 关 重 要 ， 也 市 


1 引言 


平方 公里 阵列 望远镜 (Square Kilometre Ar- 
ray, 简称 SKA ) A 是 一 项 国际 大 科学 工程 ， 将 
建造 成 为 世界 上 最 大 、 最 灵敏 的 射电 望远镜 。 经 过 
多 年 的 准备 工作 ， 具 备 SKA 望远镜 接收 能 力 10% 
的 第 一 阶段 SKA-1 (SKA Phase 1, 简称 SKA-1) 已 


经 于 2021 年 7 月 开始 建设 , SKA-1 由 位 于 澳大利亚 
的 SKA1l-low 和 南非 的 SKA1-mid 两 个 台 址 组 成 ， 覆 
善 频率 为 50MHz ~ 15.3 GHz. 


来 了 对 后 续 数 据 管 理 及 数据 处 理 的 巨大 挑战 。 根 据 
当前 的 数据 估算 以 及 与 全 球 大 型 强 子 对 撞 机 计算 网 


格 (Worldwide Large Hadron Collider Computing 
Grid, 简称 WLCS) 的 比较 , 将 数据 从 台 址 国 的 科学 
数据 处 理 器 (Science Data Process, 简称 SDP ) 传输 
到 各 个 SKA 区 域 中 心 (SKA Regional Centre, fij 


了 绍 光 等 
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行 定 量化 的 描述 ; 并 通过 对 不 同 阵列 在 目前 CSRC- 
P 上 进行 的 实验 和 测试 ， 得 出 具体 数据 流 ， 以 此 来 
阐述 SKA1 数据 流 的 概况 与 全 规模 SKA 正式 运行 
后 , 对 CSRC-P 计 算 、 存 储 和 算 力 的 影响 。 从 而 给 出 


称 SRC) 需要 高 速 稳 定 的 洲际 网 络 支持 铝 。 根 据 每 
个 SRC 数据 分 担 的 评 佑 ， 为 了 满足 SKAL 的 数据 
传输 ， 网 络 带 宽 至 少 需要 达到 100Gbps 的 带宽 站， 
才能 保证 SKAL 产生 的 数据 稳定 及 时 地 到 达 各 个 
SRC，SKA1 正式 运行 后 分 发 到 SRC 的 数据 流 预 
估 为 每 年 710PB, 算 力 至 少 需要 25PFlops (59, 3x 
给 SKA 设计 人 员 读 来 了 两 大 技术 挑战 : 如 何以 较 
低 功 耗 提 供 足 够 的 算 力 来 处 理 数据 流 ; 如 何 将 如 此 
大 量 的 数据 分 发 传输 到 位 于 全 球 各 地 的 SRC I9, 

截至 到 2021 年 底 公 布 的 最 快 的 高 性 能 计算 机 
(High Performance Computing, 简称 HPC) 为 安装 
在 日 本 神户 Riken 计算 科学 中 心 的 Fugaku?, HPL 
基准 测试 能 力 为 442PFlops， 该 超 算 基 于 富士 通 定 
制 的 ARM A64FX 处 理 器 ， 并 使 用 富士 通 的 Tofu 
D 互联 技术 进行 节点 之 间 的 数据 传输 ; 另外 随 着 网 
络 新 技术 的 发 展 ， 包 括 多 必 交 纤 技 术 (Multi-Core 
Fiber ， 简 称 MCF) 等 ， 当 前 全 球 互联 网 的 总 带 
宽 已 经 达到 了 618Tbps。 与 业界 最 快 的 HPC 和 全 
球 的 互联 网 络 相 比较 ，SKAL1 的 算 力 需求 与 数据 传 
输 规 模 不 算 很 大 ， 但 在 单一 科学 研究 领域 已 经 属于 
相当 海量 的 规模 ， 另 外 由 于 SKA 科学 研究 方向 较 
多 ， 观 测 模式 多 样 8 TT, ， 由 此 导致 科学 处 理 的 数 
据 流 程 十 分 复杂 Ta 引 ，HPC 通常 并 不 能 满足 其 多 样 
化 、 定 制 化 的 需求 ，SRC 的 处 理 将 需要 异 构 硬件 对 
不 同 的 科学 观测 使 用 不 同 的 处 理 管线 04 .345 ， 而 这 
些 管线 根据 数据 密集 型 、 计 算 密 集 型 、 存 储 密 集 型 
等 进行 分 类 处 理 。 

本 文 从 阵列 的 数据 接收 开始 , 到 最 后 到 达 SRC 
的 科学 数据 〈 含 图 像 、 元 数据 、 脉 冲 星 候选 体 等 数 
38 17) 的 详细 情况 , 通过 对 其 主要 包括 的 数据 传输 
速率 以 及 算 力 需求 来 介绍 SKA1 的 具体 数据 流 ， 由 
T SKA1 的 观测 配置 目前 尚未 最 终 固化 ， 当 前 对 
数据 流 仪 进行 模型 预 估 人 处理; 通过 对 SK AL 的 阵列 
布局 具体 情况 及 阵列 部 署 的 具体 原则 ， 对 数据 流 进 


1) https://www.top500.org/ 


对 未 来 CSRC-P 数 据 模拟 的 一 些 建议 和 规划 。 


2 SKA 数据 流 


来 自 射 电源 的 无 线 电信 号 到 达 SKA 望远镜 阵 
列 后 被 天 线 接收 ， 经 过 模拟 数字 转换 器 (Analog 
to digital converter, 简称 ADC) 转换 为 数字 信号 ， 
随后 数据 流 进入 中 央 信 号 处 理 系统 (Center Signal 
Processing, 简称 CSP) 进行 相关 人 处理, 输出 可 见 度 
数据 ， 这些 数 据 将 经 过 初步 预 校准 , 产生 校准 数据 、 
图 像 数据 和 其 他 元 数据 ， 经 深度 处 理 后 ， 这 些 数据 
将 开放 给 科学 团队 ， 进 行 后 续 的 科学 研究 工作 。 

如 图 1 所 示 ， 在 整个 数据 观测 处 理 流程 中 ， 
SKAl-ow 的 外 围 站 通过 远程 处 理 设施 (Remote 
Processing Facilities, 简称 RPF) 处 理 后 与 核心 站 
通过 中 央 处 理 设备 (Central Processing Facilities, 
简称 CPF ) 处理 后 的 数据 传输 到 科学 操作 中 心 (Sci- 
ence Operations Centre， 人 简称 SOC), ，SKA1-mid 
的 所 有 人 台 站 直接 通过 CPF 传输 到 SOC, ， 后 续 经 
由 科学 处 理 中 心 (Science Processing Centre, 简称 
SPC) 分 发 到 分 布 于 各 大 洲 的 SRC, 由 SRC 将 数 
据 开 放 授 权 给 科学 家 和 用 户 。 

SKA 天 文 台 
SKATE | 


图 1 SKA 观测 数据 流 示意 图 
Figure 1 Data Flow Diagram of SKA Observation 
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参数 如 表 1 所 示 , 其 中 的 Nj 为 观测 频率 通道 最 大 值 ， 
实际 观测 中 不 会 超过 该 值 ， 对 于 SKA1-mid 观测 而 
言 ， 大 多 数 的 观测 模式 下 该 值 较 小 ， 以 SKA-VLBI 
为 例 , 频率 通道 一 般 64K 就 可 以 满足 观测 需求 "9 。 


表 1 SKA1 阵列 参数 
Table 1 Parameters of SKA1 Array 


SKA1-low SKA1-mid 
天 线 数量 Nant 131072 197 
积分 时 间 taump 0.6s 0.08s 
频率 通道 Ny 256,000 256,000 
波束 Nbeam 1 1 
阵列 /口径 大 小 Ds 35 Æ 13.5 米 /15 米 
最 大 基线 Boa. 80 公里 150 公里 
观测 带宽 Ay 300MHz 770MHz 
分 辨 率 0.25arcsec ''arcsec 


当前 SKA 确定 了 5 个 首要 的 科学 目标 (Key 
Science Project, 简称 KSP), 包括 宇宙 黎明 和 黑暗 
时 期 探测 ， 星 系 演化 、 字 宙 学 与 瞳 能 量 研 究 ， 利 用 
脉冲 星 和 黑洞 进行 引力 的 强 场 检 验 ， 罕 宙 人 磁场 的 起 
JURE. TERES, DUE KSP 均 包 括 基 
础 物理 学 、 天 体 物 理学 或 者 宇宙 学 中 尚未 解决 的 问 
题 凡 220， 同 时 也 孕育 着 包括 宇宙 第 一 缕 曙 光 的 重 
大 科学 发 现 。 随 着 SKAL 的 开工 建设 , 不 需要 整个 
SKA 阵列 灵敏 度 、 分 辩 率 或 者 频率 覆盖 范围 的 重 
要 科学 主题 被 确定 为 高 优先 级 (High Priority Sci- 
ence Objective, HPSO) WMH, 经 过 广泛 的 论证 和 
pie, 我 国 也 确定 了 “2 十 1” 的 战略 部 署 ， 即 确保 两 
个 优先 突破 领域 和 若干 具有 特色 的 研究 方向 ， 并 于 
2020 年 启动 了 2 项 SKA 科学 专项 , 分 别 为 宇宙 再 
电离 (the Epoch of Reionisation, 简称 EoR) 项 目 
和 脉冲 星 项 目 ，EoR 将 利用 当前 SKA 先导 阵列 的 
观测 数据 再 现 宇宙 的 黎明 ， 同 时 参加 大 天 区 的 低频 
巡天 ， 从 统计 上 揭示 宇宙 再 电离 时 代 的 宇宙 整体 结 
构 特 性 ; 脉冲 星 项 目 主要 包括 脉冲 星 搜索 (Pulsar 
Search, 简称 PSS) 和 脉冲 星 计 时 (Pulsar Timing, 
简称 PST) ， 两 者 主要 聚焦 于 检验 引力 波 理论 和 探 
测 发 现 超 大 质量 黑洞 的 合并 事件 趾 。 

根据 当前 SKA 先导 阵列 MWA, ASKAP, LO- 
FAR 等 的 经 验 ， 需 要 传输 归档 到 SRC 的 数据 除了 


数据 立方 体 数 据 外 ， 还 包括 整个 流水 线 处 理 优化 的 
UV 数据 、 用 于 校准 流水 线 的 中 间 产 品 、UYV 格 点 
化 数据 、 点 源 扩散 函数 (Point Spread Function, fij 
BE PSF) 立方 体 以 及 多 种 分 辨 率 的 加 权 和 权重 信息 
A& [22-25]. 

接 下 来 数据 流 的 预 估 将 主要 依据 HPSO 科学 
目标 29 及 其 观测 时 间 占 比 ， 整 个 流程 包括 观测 
数据 的 初步 生成 、 经 过 相关 处 理 、 预 处 理 等 流程 。 
当然 除 此 以 外 ， 最 终 的 科学 数据 还 包括 项 目 负责 
(Principal Investigator， 简 称 PI) 领导 的 各 个 重要 
观测 、 其 他 科学 发 现 以 及 SKA-VLBI 项 目 等 。 


2.1 观测 台 站 端 


阵列 中 的 天 线 接收 到 原始 的 模拟 信号 后 ， 首 先 
将 信号 数字 化 , 为 了 提高 信号 的 时 间 和 频率 分 辨 率 ， 
还 会 使 用 有 限 脉 冲 滤波 (Finite Impulse Response, 
简称 FIR) 和 快速 健 里 叶 变 换 (Fast Fourier Trans- 
form, 简称 FFT) 操作 。 对 于 SKA1-low 还 会 进行 波 
束 合成 来 进行 信号 的 校准 和 时 延 补偿 操作 。 

此 处 假定 天 线 数目 为 Nan, GARRA Noor 路 
极 化 输出 , fa SHR ae EA Av, Fa ASSES RR ACE 
定理 可 知 ， 采 样 率 至 少 为 2Av， 在 使 用 N 阶 FIR 
时 ， 计 算 量 大 约 为 2Wap， 根 据 FFT 的 算法 复杂 度 
O(nlogn) 可 知 ，FFT 运算 的 运算 数 为 Wiogw， 此 时 
每 个 站 经 过 多 项 滤波 器 后 需要 的 操作 总 数量 级 为 : 


2N, tap, ant* * pol Ay * 2N, bands lo 82 (QN, band )N, antt * pol AV pand 


对 于 波束 合成 而 言 ， 通 过 给 每 个 天 线 提供 正确 的 延 
迟 来 进行 校准 ， 主 要 用 于 高 时 间 分 辨 率 和 高 频率 
分 辩 率 的 科学 应 用 ， 比 如 脉冲 星 、 行 星际 闪烁 等 ， 
SKA1l-low 的 相关 处 理 机 波束 合成 部 件 (Correlator 
BeamFormer， 简 称 CBF) 接收 512 个 站 的 数据 ， 
并 生成 斯 托 克 斯 的 四 个 参数 数据 。 不 过 此 时 的 校准 
相对 于 FFT 和 FIR 而 言 ， 计 算 运 算 量 较 小 ， 此 处 
评估 暂时 忽略 该 项 ， 所 以 此 时 对 于 每 个 观测 台 站 而 
言 ， 其 输出 的 整体 数据 速率 大 约 为 : 


R station © N, beam sN banas N, pol Afi band S sample 
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由 上 式 可 知 ， 采 集 带 宽 和 采样 比特 数 极 大 地 影 
响 了 每 个 台 站 或 阵列 的 数据 流 ， 根 据 表 1 进行 估算 ， 
可 知 从 台 站 端 到 达 CSP 的 速率 约 在 Tbps 量 级 ,中 
频 阵 列 共 计 197 (其 中 64 面 属于 当前 MeerKAT) 
面 望远镜 ， 原 始 数据 输出 速率 约 为 2TB/s; 低频 
阵列 共计 131072 个 天 线 ， 原 始 数据 输出 速率 为 
158TB/s. 


2.4 ‘CSP 


CSP 主要 用 于 将 来 自 台 站 端的 数据 进行 相关 
处 理 操作 , 在 相关 之 前 会 进行 诸如 时 延 补偿 的 操作 ， 
用 于 消除 由 于 地 球 自转 引起 的 条 纹 旋 转 ; 同时 进行 
更 精细 的 信道 化 ,用 于 提高 分 辩 率 ,并 做 带 通 滤波 用 
于 矫正 台 站 多 项 滤波 的 影响 。 根据 科学 目标 的 不 同 ， 
划分 的 精细 化 通道 不 一 定 相 同 ， 此 处 假定 为 Nonan。 
在 CSP 还 会 进行 射频 干扰 的 去 除 (Fadio Frequency 
Interference, ifr RFI) ， 由 于 其 计算 量 较 小 ， 此 
处 估算 暂时 不 考虑 ， 所 以 此 时 CSP 输出 的 数据 速 
率 主要 为 台 站 的 两 两 相关 处 理 产 生 的 : 


NpeamsNehanN? N? 


stat pol 
Resp o 
lqump 


由 于 数据 输出 速率 与 台 站 数 的 通道 数 和 台 站 
数目 的 平方 成 正比 ， 从 表 1 可 知 ， 对 于 输入 可 见 
度 的 数据 速率 预 估 为 SKA1-low 的 数据 数据 速率 为 
7.15Tbps, SKA1-mid 的 数据 数据 速率 为 6.4Tbps. 

以 SKA1-mid 为 例 ，CSP 将 来 自 天 线 的 输入 
带宽 划分 为 多 个 频率 通道 ， 然 后 分 别 做 互相 关 处 
理 ， 此 时 的 数据 流 输入 为 : 133 个 SKA KEE (每 个 
100Gbps 输出 带宽 ) 和 64 个 MeerKAT 天 线 (每 个 
40Gbps 输出 带宽 ) 接收 数据 ，CSP 的 总 输入 带宽 
约 为 57Tpps， 由 于 成 像 数据 处 理 与 脉冲 星 处 理 的 
流程 不 同 ， 对 于 成 像 而 言 ， 采 用 两 级 信道 化 ， 第 一 
级 为 512 个 粗 信 道 ， 第 二 级 为 64000 精细 化 通道 ; 
对 于 脉冲 星 搜索 而 言 , 在 300MHz 的 子 频带 上 提供 
24 75kHz 的 信道 化 通道 , 将 时 间 分 辩 率 降低 到 约 ~ 
64us; 以 6.4Tbps 的 速度 输出 数据 091, 

相关 处 理 将 输出 可 见 度数 据 ， 最 大 的 分 辩 率 
在 SKA1-mid 的 所 有 基线 上 可 以 达到 0.1s 的 积分 时 
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间 。 而 相关 处 理 的 输出 结果 主要 取决 于 积分 时 间 和 
通道 数目 。 基 线 依赖 平均 (Baseline Dependent Av- 
eraging， 简 称 BDA) 技术 可 以 减少 基于 射电 干涉 
仪 基线 分 布 的 可 见 度数 据 量 , 通过 对 全 规模 SKA1- 
low 的 模拟 ， 预 计 使 用 BDA 可 以 将 可 见 度数 据 量 
在 不 同 的 时 间 间 隔 上 减少 约 50% ~ 85% PT, 


2.3 SDP 


SDP 接收 来 自 CSP 输出 的 数据 进行 初步 成 像 
预 处 理 ， 虽 然 目 前 SKA 最 终 的 成 像 策略 尚未 确定 ， 
不 过 从 当前 几 个 SKA 探 路 者 项 目 ( 包 括 欧洲 的 LO- 
FAR, KAEA MWA 和 ASKAP) XA, FE 
要 包括 校准 、 成 像 的 迭代 主 循环 (Major) 和 反 卷 
积 的 迭代 次 循环 (Minor)， 其 中 的 Major/Minor 为 
主要 的 计算 资源 部 分 。 经 过 数 次 迭代 后 ，SDP 使 用 
改进 的 天 空 模型 推导 出 新 的 校准 参数 ， 并 开始 新 的 
校准 循环 以 进一步 增强 模型 ， 最 后 通过 恢复 残 差 图 
像 中 的 源 来 创建 最 终 的 天 空 图 像 。SKA1 阶段 SDP 
从 相关 处 理 设 备 获 取 的 数据 主要 包括 图 像 和 校准 数 
据 等 ,通常 不 会 保留 可 见 度数 据 , 但 对 于 SKA1-low 
的 高 优先 级 项 目 宇宙 再 电离 EoR 例外 ， 因 为 该 项 
目 需要 保留 可 见 度数 据 才 能 有 效 地 去 除 前 景 干扰 。 
SKA1-mid 的 SDP 接收 来 自 CSP 的 输入 数据 以 及 
来 自 望 远 镜 管理 (Telescope Manager, 简称 TM) 的 
数据 0 ， 并 生成 包含 科学 产品 和 校准 产品 的 数据 ， 
主要 为 连续 谱 、 谱 线 立 方 体 数 据 成 像 数据 ， 脉 冲 星 
搜索 的 候选 数据 ， 和 暂 现 源 探测 数据 ， 单 天 线 强 度数 
据 以 及 消除 大 气 和 电离 层 影 响 的 校准 数据 等 。 


2.4 SRC 计算 负载 需求 


SKA 一 个 重要 的 挑战 就 是 需要 管理 和 处 理 来 
目 不 同 数据 处 理 流程 的 数据 ， 并 产生 高 动态 范围 的 
图 像 和 其 他 数据 产品 ， 提 供 对 后 续 科 学 的 支持 1。 
根据 SDP 的 当前 设计 ， 标 准 的 数据 产品 将 根据 每 
个 观测 项 目 来 制定 。 对 于 成 像 观测 而 言 ， 均 可 以 在 
三 个 维度 (两 个 空间 , 一 个 光谱 )、 偏振 及 图 像 中 产 
生 最 大 分 辩 率 的 数据 产品 52 ， 而 其 中 数据 量 缩减 
最 多 的 阶段 就 在 将 可 见 度 数据 进行 成 像 处 理 的 操作 
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数据 流 带宽 


算 力 资源 


图 2 数据 流 示意 
Figure 2 Data Flow Diagram 


详细 的 观测 数据 流 示意 图 如 图 1 所 示 ， 各 个 阶 
段 的 产品 数据 流 示意 图 如 图 2 所 示 。 台 站 产生 的 原 
台 观 测 数 据 ， 在 SDP 经 过 初步 处 理 生成 初步 的 科 
学 数据 产品 ， 主 要 包括 成 像 的 数据 (比如 图 像 或 者 
格 点 化 的 可 见 度数 据 ) 和 其 他 数据 ， 其 中 成 像 数 据 
的 大 小 十 分 依赖 于 通道 数量 ， 最 后 的 文件 大 小 正比 
于 通道 数量 ， 这 些 数据 通过 洲际 网 络 分 发 到 每 个 区 
域 数据 中 心 的 子 网 络 ， 天 文学 家 通过 互联 网 连接 到 
区 域 数 据 中 心 进行 数据 处 理 ， 此 时 的 数据 称 为 高 级 
数据 产品 (Advanced Data Products, 简称 ADP), 
此 时 的 ADP 可 以 通过 SKA 区 域 中 心 或 者 云 的 方 
案 提供 给 最 终 的 科研 人 员 。 


在 SKA-1 的 所 有 处理 流水 线 中 ， 成 像 管道 占据 
了 主要 的 计算 需求 和 资源 , 如 图 3 约 占 SKA1-low 观 
测 时 间 15% 和 31% 的 EoR 成 像 和 功率 谱 观 测 , 对 
应 的 计算 负载 约 为 31% 和 55%; 非 成 像 处 理 管道 
对 计算 的 需求 相对 较 小 ， 比 如 脉冲 星 搜索 流水 线 系 
Zi (Pulsar Search Pipeline, 简称 PSP), 约 占 SKA1- 
low 上 HPSO 时 间 的 39% 和 SKA1-Mid 的 5% 的 
Ta]. 对 于 SKA1-low 而 言 , 如 果 不 包含 EoR 的 UV 
可 见 度 数据 ， 科 学 数据 速率 约 为 3Gbps， 如 果 增 加 
UV 可 见 度数 据 , 那么 数据 率 将 增加 到 25Gbps; 对 
于 SKA1-mid 而 言 ， 科 学 数据 速率 约 为 9Gbps 9? 。 


FBR ICS. 


Telescope time and Compute load of SKA1-LOW/MID 


Telescope time for SKA1-LOW 


Telescope time for SKA1-MID 


Pulsar Search 


图 3 SKAL 高 优先 级 项 目 观测 时 间 与 计算 负载 评估 
Figure 3 Estimation observate time and compute load of 


SKA1 HPSO 


以 PSP 为 例 , 仅 需 要 实时 校准 ( Real-time cal- 
ibration, RCAL); 但 对 于 连续 谱 成 像 而 言 , 还 需要 
迭代 自 校 准 (Iterative self-calibation, ICAL), Æ 
成 泰勒 项 图 像 的 数据 准备 管线 (Data preparation 
pipeline producing Taylor-term images, DPrepA), 
生成 粗 信道 化 图 像 的 数据 准备 管线 (Data prepa- 
ration pipeline producing coarse channelised im- 
ages, DPrepB); ; 而 谱 线 成 像 管 线 还 需要 额外 的 生 
成 精细 信道 化 图 像 的 数据 准备 管线 (Data prepa- 
ration pipeline producing fine channelised images, 
DPrepC) 。 

从 图 3 可 知 , 通过 相应 的 加 权 计 算 , 最 后 的 计算 
负载 约 为 SKA1l-low 需 要 至 少 13.6PFLOPS, SKA1- 
mid 需 要 至 少 11.5PFLOPS, 所 以 SKA1 阶段 SRC 
需要 的 算 力 预 估 为 25.1PFLOPS. 


3 SKAL 阵列 布局 


为 了 实现 SKA 的 科学 目标 ， 在 建设 成 本 与 技 
术 方 面 要 均衡 考虑 ， 需 要 建造 一 个 满足 极端 性 能 
求 而 且 造 价 相 对 可 挖 的 望远镜 。 这 需要 对 当前 的 科 
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学 需求 及 各 种 技术 参数 (阵列 的 基线 长 度 、 尺 寸 大 
小 、 天 线 灵敏 度 、 功 耗 等 ;进行 评估 。 最 终 确认 了 
由 包含 澳大利亚 和 南非 为 台 址 的 方案 。 

在 SKA 的 阵列 布局 和 设计 中 ， 优 先 考 虑 了 
KSP 科学 观测 的 需要 ， 通 过 基线 长 度 的 增加 ， 来 
提高 空间 分 辨 率 ， 采 用 核心 阵列 ， 用 于 增加 UV 2€ 
盖 ， 提 高 灵敏 度 。 另 外 在 设计 中 还 考虑 了 包括 但 不 
限于 频率 范围 、 灵 人 敏 度 、 观 测 带宽 、 极 化 能 力 、 采 
集 面 积 、 基 线 长 度 、 处 理 能 力 等 因素 。 其 中 最 重要 
的 儿 个 因素 如 下 : 

e 4 HR: 实现 高 优先 级 科学 所 需要 的 分 辩 率 需 
求 。 分 辨 率 取决 于 频率 设置 ， 高 频 相 对 于 低频 而 言 ， 
更 容易 实现 高 空间 分 辨 紊 。 比如 150KM 的 阵列 , 在 
8GHz 观测 时 ， 其 分 辨识 可 以 达到 0.0629arcsec 

e UV 快照 覆盖 : 基线 问 量 的 二 维 分 布 决 定 了 瞬 
时 空间 频率 的 覆盖 范围 ， 应 该 尽 可 能 多 地 覆盖 到 
UV 平面 ， 在 螺旋 阵列 的 布局 中 ， 人 快照 覆盖 主要 由 
螺旋 的 旋转 角度 、 螺 旋 臂 上 天 线 的 位 置 以 及 螺旋 臂 
的 数量 决定 。 在 图 45 可 以 看 到 螺旋 的 角度 以 及 天 线 
的 位 置 都 经 过 了 调整 ， 以 提供 良好 的 UV Beate 

e 核心 区 域 : 核心 区 域 主要 考虑 提供 足够 的 灵敏 
度 ， 用 于 文 持 脉冲 星 搜索 观测 和 HI 线 的 观测 


3.1 SKAI-mid 


SKA1l-mid 望 远 镜 的 运行 频段 为 0.35 ~ 15.3 
GHz, 位 于 南非 的 卡 鲁 沙漠 , 主要 进行 脉冲 星 、21 JE 
米 中 性 所 和 连续 谱 的 高 灵敏 度 观 测 等 科学 研究 "3 。 
该 望远镜 由 133 个 直径 为 15 米 的 偏 置 格 里 高 利 天 
线 ， 和 MeerKAT 望远镜 建造 的 64 个 直径 为 13.5 
米 的 天 线 组 成 。SKA1-mid 有 一 个 直径 为 1 公里 的 
核心 阵 ， 一 个 随机 放置 的 3 公里 的 二 维 阵列 和 三 个 
螺旋 臂 ， 最 长 基线 为 150 公里 蕊 约 ， 具 体 的 布局 示 
意图 如 图 4 所 示 。 


3.2 SKAI-low 

SKA1-low 望远镜 的 运行 频段 为 50 ~ 350 MHz 
， 部 署 在 澳大利亚 西部 的 默 奇 森 射电 天 文 台 ， 主 要 
进行 宇宙 再 电离 、 脉 冲 星 、 太 阳 系 外 星系 等 科学 研 


2) https://github.com/OxfordSKA/OSKAR 
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2505], SKAl-low3t-fg 131072 个 对 数 周期 天 线 , 这 
些 天 线 分 为 512 个 站 , 每 个 站 256 TRR. 这些 站 
点 中 的 296 个 将 被 配置 到 一 个 中 心 核心 区 域 ， 其 余 
216 个 沿 三 个 旋 臂 部 署 ， 最 长 基线 65 AM, H 
体 的 布局 示意 图 如 图 5 所 示 。 

当前 的 孔径 综合 阵列 技术 在 进行 校准 和 成 像 算 
法 方面 已 经 相对 成 熟 ， 但 对 于 SKA1-mid 的 量 级 数 
据 还 需要 进行 软件 和 算法 的 研发 ， 才 能 支持 如 此 海 
量 的 数据 ， 并 在 减少 人 工 输 入 的 情况 下 得 到 更 好 的 
动态 范围 na 。 


4 实验 测试 


本 章节 列举 了 使 用 OSKAR2 进 行 SKA1-low 
和 SKA1-mid 的 模拟 数据 生成 , 主要 阐述 了 模拟 过 
程 的 思路 、 方 法 、 运 行 及 计算 的 时 间 和 最 后 产生 的 
数据 文件 大 小 等 。 

OSKAR 为 剑桥 大 学 开发 的 用 于 SKA 模拟 的 
一 套 软件 , 基于 射电 干涉 测量 方程 (Radio Interfer- 
ometer Measurement Equation, 简称 RIME) 模拟 
生成 可 见 度数 据 ， 主 要 功能 为 模拟 台 站 波束 、 干 涉 
阵列 数据 ， 可 以 生成 对 应 的 二 进 制 可 见 度 数据 或 测 
量 集 数据 (Measurement Set， 简 称 MS), ， 同 时 还 
可 以 将 FITS 文件 转变 为 天 空 模型 、 对 可 见 度数 据 
增加 噪声 等 功能 。 

模拟 实验 的 策略 为 选取 不 同 的 天 空 模型 源 数 
目 , 分 别 为 9,100,1024,10000; 观测 时 间 从 1 秒 到 24 
小 时 , 分 别 为 18, 6s, 60s, 600s,1200s , 2400s , 3600s, 
7200s, 14400s, 28800s, 43200s, 54000s, 72000s, 
86400s， 频 率 通 道 默认 为 1，SKA1-mid 的 观测 频率 
选 定 为 1.4GHz, Wty 1IKHz，SKA1-low 的 观测 
频率 选 定 为 200MHz， 和 带宽 为 30MHz。 


4.1 ”SKA1l-mid 模 拟 数据 测试 


对 于 SKA1-mid 的 模拟 试验 ， 因 为 计算 量 不 高 ， 
故 使 用 了 2 种 不 同 的 GPU 板 卡 ， 用 于 评估 整套 模 
拟 系统 的 可 扩展 性 和 稳定 性 ， 板 卡 分 别 为 NVIDIA 
的 Tesla K40M 和 Tesla K20X. 其 中 Tesla K20X 
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图 4 SKA1 中 频 阵 列 布局 示意 图 
Figure 4 Layout diagram of SKA1-mid Array 


基于 Kepler 架构 ， 有 2688 个 核 ， 具备 6GB 的 
内 存 ， 总 线 带宽 可 达 249.6GB/s， 双 精度 的 理论 值 
为 1312GFLOPS; Tesla K40m 基于 Kepler 架构 ， 
有 2880 个 核 ， 具 备 12GB 的 内 存 ， 总 线 带 宽 可 
达 288.4GB/s， 双 精度 的 理论 值 为 1682GFLOPS; 
可 知 从 具备 的 核心 数 、 内 存 、 总 线 带 宽 和 理论 值 ， 
Tesla K40m 均 优 于 K20X， 从 对 阵列 的 实测 结果 
图 6,7,8 也 可 以 看 到 ，K40m 的 试验 参数 比 K20X 有 
所 提升 ， 不 过 提升 不 大 ， 主 要 因为 两 个 板 卡 属于 同 
一 个 系列 , 不 过 K40m 还 是 具有 优势 的 , 在 多 点 模 
拟 过 程 中 ， 消 耗 的 时 间 均 低 于 对 应 的 K20X 显卡 。 
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图 7 SKA1 中 频 阵列 K40m 模拟 
Figure 7 Simulation of SKA1-mid based on Tesla K40m 


Total runtime (TeslaK20x) 
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图 6 SKAI1 中 频 阵列 K20X 模拟 
Figure 6 Simulation of SKA1-mid based on Tesla K20X 
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5 SKAL 低频 阵列 布局 示意 图 


Figure 5 Layout diagram of SKA1-low Array 
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图 8 SKAI 中 频 阵列 K20X 与 K40m 模拟 对 比 


Figure 8 Simulation compare of SKA1-mid between Tesla 


K20X and K40m 
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4.0 ”SKA1-low 模 拟 数 据 测试 


由 于 SKA1-low 的 台 站 较 多 ， 算 力 需求 比较 大 ， 
将 使 用 China-SRC 平台 进行 上 述 模拟 测试 ,CSRC- 
P 搭 载 的 GPU 型 号 为 NVIDIA Tesla V100 SXM2, 
该 GPU 采用 Volta 架构 ,有 5120 个 核 , 具备 32GB 
内 存 ， 总 线 带 宽 可 达 897GB/s， 双 精度 的 理论 值 为 
7834TFLOPS, 在 对 SKA1l-low 进 行 模拟 时 , 可 以 看 
到 对 于 观测 时 长 在 2400s 以 内 的 数据 ， 模 拟 时 间 均 
在 100 秒 以 内 ， 充 分 显示 了 V100 芯片 在 计算 方面 
的 强大 优势 。 
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图 9 SKAL 低频 阵列 模拟 数据 生成 消耗 时 间 
Figure 9 Simulation data generation time consumption of 


SKA1-low Array 


从 表 2 看 到 ,最 终 的 模拟 数据 大 小 与 天 空 模型 中 
的 源 相 关 性 不 大 ,模拟 所 花费 的 时 间 也 基本 一 致 B 


的 可 见 度数 据 大 小 约 为 2.048GB ， 约 2TB/s. 


5 总 结 与 展望 


SKA 无 疑 将 是 有 史 以 来 最 大 的 射电 观测 基础 
设施 之 一 ， 通 过 对 SKAL 整套 系统 的 数据 流 进行 
了 基于 模型 的 预 舍 、 分 析 和 模拟 ， 其 Tbps 的 数据 
流 、PB 级 的 存储 归档 需求 及 观测 复杂 性 ， 对 后 续 
的 数据 管理 、 处 理 、 计 算 、 存 储 和 网 络 都 提出 了 最 
严峻 的 挑战 ， 通 过 对 整个 数据 流 的 讨论 ， 为 后 续 的 
中 国 SKA 区 域 中 心 的 正式 运行 提供 数据 系统 级 的 
支持 。 项 目 将 结合 射电 天 文 技术 以 及 包括 信息 、 通 
信 、 计算 机 等 现代 信息 技术 。SKA 的 超大 数据 流 将 
极 大 地 改变 天 文 研究 的 方式 ， 而 使 SKA 成 功 运行 
则 需要 对 传统 框架 设计 进行 革命 性 的 改进 和 突破 。 


拟 的 时 间 与 最 终生 成 的 可 见 度数 据 的 大 小 ， 主 要 取 
决 于 观测 的 时 间 。 并 且 通 过 设 定 观测 的 频率 通道 可 
Al, 文件 的 最 终 大 小 正比 于 该 值 , 对 于 SKA1-low 模 
拟 而 言 , 如 果 使 用 表 1 中 最 大 的 频率 通道 , 每 秒 产 生 


在 SKA1 阶段 就 需要 联合 电子 学 、 计 算 机 技术 、 信 
息 等 领域 多 个 学 科 的 专业 知识 来 进行 应 对 。 SKA 也 
将 特别 推动 信息 技术 、 天 文 软件 和 通讯 技术 等 的 发 
展 。 
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Scientific data flow and array simulation analysis for the 
SKA-1 era 


GUO ShaoGuang!*, Lu Yang!, AN Tao!?, LAO BaoQiang?”, 
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1. SKA Regional Centre Joint Lab, Shanghai Astronomical Observatory, Key Laboratory of Radio Astronomy, Chinese 
Academy of Sciences, Shanghai 200030, China; 
2. SKA Regional Centre Joint Lab, Peng Cheng Laboratory, Shenzhen, 518066, China 


After years of planning for the next generation of radio telescopes, the Square Kilometer Array (SK A), the 
construction of the SKA phase one (SKA1) had started in July 2021. After the formal operation of SKAI, 
it is expected that 750 petabytes of scientifically processed data will be generated every year. The data will 
be stored at SKA regional centers around the world for further analysis by researchers. In this paper, the 
models of SKA observation station, central signal processor, scientific data processing and regional center are 
quantitatively analyzed. Based on the high-priority scientific observation of SKA1, the data flow evaluation 
at each stage and the demand for computing power of scientific data processing are obtained. Taking the 
current SKA1-low and SKA1-mid arrays as examples, the key factors affecting the layout of interference arrays 
including resolution, sensitivity and UV coverage are summarized. Finally, OSKAR is used for data simulation 
of interference array. Through the simulation of SKA1-mid, the scalability and stability of the system are 
obtained. Through the simulation of SKA1-low on CSRC-P, it can be seen that the design of prototype SKA 
regional center in China has been fully optimized. And the detailed requirements of computing power and the 
detailed information of data volume are obtained. The SKA's demand for data processing, computing and 
storage also requires a combination of technologies and interdisciplinary efforts from areas such as electronics, 
communication, information technology and computer. 
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